Перейти к основному содержимому

1.09. Данные и информация

Всем

Данные и информация

Основные понятия

Информация – различные сведения, данные, передаваемые посредством сигналов и воспринимаемые человеком или специальным устройством. Это могут быть абсолютно любые сведения, которые можно сохранить, преобразовать и передать.

Сведения — это совокупность фиксированных в любой форме сообщений, которые передают знания о чём-либо, отражают характеристики, события, свойства или связи.

Данные – поддающееся многократной интерпретации представление информации в формализованном виде, пригодном для передачи, связи или обработки.

Состояние данных — это текущее содержание и организация информации в момент времени, включая её структуру, формат и физическое размещение.

Структура данных — это способ организации информации, определяющий взаимное расположение элементов, связи между ними и порядок доступа к содержимому.

Формат данных — это набор правил, описывающих, как информация представлена в файле или потоке: порядок байт, наличие заголовков, разделителей, метаданных и кодировок.

Тип данных — это категория, определяющая допустимые значения, операции над ними и способ хранения в памяти или на носителе.

Вид данных — это классификация информации по характеру содержания: текстовые, числовые, графические, аудио, видео, бинарные и другие категории, отражающие суть представляемых сведений.

Физическое размещение данных — это конкретное расположение информации на материальном носителе: секторы диска, ячейки оперативной памяти, блоки флеш-памяти или участки кэша процессора.

Частенько слова «информация» и «данные» употребляют, подразумевая одно и то же, и в принципе, оно так и есть, если не углубляться в глубокую информатику, однако данные – это информация, превращённая в какую-то форму. Иначе говоря, картинка – данные, но картинка содержит в себе информацию, просто эта информация была представлена в графической форме.

Форма — это структурированный способ представления информации, определяющий её внешний вид, структуру и правила интерпретации.

Другой пример – данные – это факты, допустим, набор цифр. А информация – осмысленные данные, которые спрятаны в изначальных данных. Аналог – данные - ноты на бумаге, а информация - мелодия, которую мы слышим.

Факт — это проверенное и объективно существующее событие, явление или утверждение, не зависящее от мнений или интерпретаций.

Цифры — это условные знаки, используемые для записи чисел и представления количественных значений в системах счисления.

Буквы — это графические символы, используемые в письменных языках для обозначения звуков речи и построения слов.

Символы — это условные знаки, применяемые для представления понятий, действий, значений или команд в языках, кодировках, системах записи.

Обозначение — это условный знак или совокупность знаков, выбранных для идентификации, именования или ссылки на объект, понятие, величину или операцию.

Компьютер – это не живое и не мыслящее создание, оно не понимает текст, который мы пишем, не понимает и не рассуждает, ибо это электронное вычислительное устройство, работающее по инструкциям, и которое понимает лишь один язык, в котором, на самом деле, всего два «слова»:

  • сигнал есть (1);
  • сигнала нет (0).

Сигнал — это физический процесс, несущий информацию и способный изменять своё состояние во времени или пространстве для передачи данных между устройствами или системами.

Понимание — это результат обработки информации, при котором становится возможным извлечение смысла, установление связей и применение знаний в новых ситуациях. Этим как раз-таки и не обладает компьютер, ведь смысл нужен нам, а не технике.

Следовательно, и вся информация в электронном виде – это совокупность огромнейшего количества нулей и единиц – обозначений «сигнал есть/сигнала нет». И эта минимальная единица, этот сигнал (его отсутствие) – и есть бит.

image-1.png

Технически, все электронные устройства, упрощённо, понимают ровно так же, как лампочка - либо сигнал есть, либо нет. Поэтому все команды, коды и инструкции превращаются в набор битов.


Размер

Объём — это количественная мера занимаемого пространства или ресурсов, например, количество байт, необходимых для хранения данных.

Размер — это численное выражение объёма данных, представленное в принятых единицах измерения (байтах, килобайтах и так далее).

Размер данных измеряется в следующих единицах:

ЕдиницаСокращениеРазмер
Битbit (b) бит0 или 1
БайтByte (B) Б8 бит
КилобайтKB КБ1024 байта
МегабайтMB МБ1024 КБ
ГигабайтGB ГБ1024 МБ
ТерабайтTB ТБ1024 ГБ
ПетабайтPB ПБ1024 ТБ
ЭксабайтEB ЭБ1024 ПБ
ЗеттабайтZB ЗБ1024 ЭБ
ЙоттабайтYB ЙБ1024 ЗБ

Практическое задание
Попробуйте посчитать, сколько байт в мегабайте?

Так принято, что объем (размер) файлов измеряют в байтах (допустим, 40 МБ), а битами измеряют скорость (допустим, скорость интернет-соединения, Мбит/с).

Скорость — это мера изменения состояния за единицу времени, например, количество переданных бит в секунду при обмене данными.

На практике, есть двоичная и десятичная системы.

Система исчисления — это совокупность правил и символов для записи чисел, характеризуемая основанием, набором цифр и способом формирования значений.

Двоичная система — это система счисления с основанием два, использующая только две цифры: 0 и 1, и применяющаяся для представления данных в цифровых устройствах.

Десятичная система — это система счисления с основанием десять, использующая десять цифр от 0 до 9, и применяемая в повседневных вычислениях и маркетинговых обозначениях.

Двоичная – 1024, а десятичная – 1000.

Это важно, ибо может путать людей:

  • жесткие диски, Flash-карты измеряют свой объем в десятичной системе (то есть, 1 ГБ – 1000 МБ, 1 млрд байт);
  • оперативная память и файлы измеряются в двоичной (1 ГБ – 1024 МБ, 1073741824 байт).

Именно поэтому, если купить USB-носитель с памятью, по факту его окажется меньше – потому что маркетинг заявляет всё в десятичной, а получаете вы двоичную, хех. И диск на 1 ТБ в Windows покажется как 931 ГБ.